گسترش پرس و جو در موتور جستجوی فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه یزد
- نویسنده سیامک ساعدی
- استاد راهنما علی محمد زارع بیدکی کیارش میزانیان
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
پرس وجو برای بیان نیازهای کاربران به اطلاعات موجود در صفحات وب و سایر منابع، مطرح می شود. پرس وجوهای کاربران معمولاً «بسیار کوتاه» و شامل دو یا سه کلمه می باشند. قابلیت زبان های مختلف در بیان یک مفهوم با چندین کلمه مترادف و وجود یک کلمه با بیش از یک معنی، منجر به مشکل «عدم تطابق کلمه» و «مبهم بودن پرس وجو» می شوند. در نتیجه تعداد زیادی اسناد غیرمرتبط بازیابی شده و دقت کاهش می یابد. برای رفع این مشکلات از تکنیک گسترش پرس وجو استفاده می شود که از طریق پیشنهاد و افزودن واژگان مناسب به پرس وجوی کاربر، موجب بهبود دقت بازیابی خواهد شد. مهمترین مسئله، تشخیص و انتخاب واژه خوب برای افزودن به پرس وجوی کاربر می باشد. در مباحث گسترش پرس وجو دو عامل مهم «روش انتخاب واژگان گسترش» و «منابع واژگان گسترش» وجود دارد. در این پایان نامه با درنظر گرفتن ویژگی های زبان فارسی و مسائل مرتبط با آن، به بررسی گسترش پرس وجو در موتور جستجوی فارسی می پردازیم. برای این کار از هستان شناسی عمومی فارس نت و شبکه مفهوم استفاده می کنیم که در برگیرنده روابط میان مفاهیم و کلمات می باشد. پس از دریافت پرس وجوی کاربر از طریق مطابقت آن با شبکه مفهوم، گروهی از کلمات مرتبط با پرس وجوی کاربر استخراج می شوند و در مرحله بعد مطابق الگوریتم ارائه شده، رتبه بندی می شوند. در پایان تعدادی از کلمات بسیار مرتبط با پرس وجوی کاربر به صورت خودکار به پرس وجوی اولیه کاربر افزوده می شوند و پرس وجوی گسترش یافته مورد جستجو قرار می گیرد. نتایج آزمایش های انجام شده، نشان دهنده بهبود عملکرد و افزایش دقت بازیابی می باشد.
منابع مشابه
گسترش معنایی پرس و جو
بازیابی اطلاعات یکی از اصلی ترین نیازهای کاربران است؛ روزانه کاربران زیادی به جستجو در وب و دیگر منابع به منظور پاسخ گویی به نیاز اطلاعاتی خود می پردازند. مسائل موجود در زبان طبیعی از جمله عدم تطابق لغوی، کلمات چند معنایی، کوتاه و مبهم بودن پرس وجو و دانش ناقص کاربران از موضوع مورد نظر در بازیابی اطلاعات منجر به بازیابی نتایج نامرتبط و کاهش رضایت کاربران از نتایج بازیابی شده می شود. گسترش پرس و...
15 صفحه اولارزیابی همپوشانی و پوشش چهار موتور جستجوی بومی اصلی: پارسی جو، یوز، پارسیک و ریسمون
هدف: پژوهش حاضر با هدف سنجش همپوشانی موتورهای جستجوی بومی پارسی جو، یوز، پارسیک، و ریسمون و مقایسه توانمندیهای این موتورها در پوشش دادن وب نمایهپذیر انجام گرفت. روش: پژوهش از نوع کاربردی ارزیابانه بود. برای گردآوری اطلاعات از روش مبتنی بر کلیدواژه بهره گرفته شد، بدین ترتیب ابتدا کلیدواژههای انتخاب شده به موتورهای جستجو ارائه و از رکوردهای بازیابی شده نمونهگیری و با توجه به وجود یا نبود ا...
متن کاملالگوهای تعامل و راهبردهای بازآرایی پرسوجو توسط کاربران در یک موتور جستجوی فارسی
فرایند جستجو در وب با زندگیِ برخط امروزی عجین شده است. موتورهای جستجو، با دریافت پرسوجوهای کاربران، تعداد محدودی از اسناد مرتبط را از میان چندین میلیارد صفحۀ وب بازیابی میکنند. بنابراین موتورهای جستجو با ثبت مجموعۀ پرسوجوهای کاربران در درازمدت میتوانند به مجموعهای از اطلاعات دربارۀ الگوهای رفتاری کاربران دست یابند. این الگوها میتوانند در فرایندهایی مانند گسترش پرسوجو، پیشنهاد پرسوجو و تص...
متن کاملکشف الگوی کلیک کاربران برای استفاده در پرس و جو
مقدمه: در طراحی موتورهای جستجو، بررسی پایگاه داده ی مورد مطالعه و ایجاد ارتباط با آن حائز اهمیت است. روش تحقیق: پژوهش حاضر از نوع کاربردی است که با استفاده از روش مشاهده اجرا می شود. آنچه که در پژوهش حاضر بکار رفته روش مطالعه موردی است. یافته ها: الگوی اغلب جستجوهای انجام شده، در بیشتر موارد به صورت کلی به جزئی و اختصاصی است. شرکت کنندگان جستجویشان را با اطلاعات کلی مانند معرفی و بر...
متن کاملالگوریتم بازیابی و رتبهبندی اطلاعات در موتور جستجوی گوگل
هدف اساسی این مقاله، تبیین نحوه عمل موتور جستجوی گوگل در رتبهبندی اطلاعات بازیابی شده است و بدین منظور، الگوریتم (خوارزمی) موتور جستجوی گوگل را در بازیابی و رتبهبندی اطلاعات بررسی میکند. در بخش اول – که text matching نامیده میشود – شیوه یافتن اطلاعات مرتبط با واژههای واردشده در جعبه جستجو، بهطور خلاصه بیان میگردد و در بخش دوم – که بخش اصلی مقاله است و PageRank نام دارد – شیوه رتبهبندی ن...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه یزد
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023